• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 " 엔비디아"에 대한 통합 검색 내용이 1,522개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
씨이랩, AI 엑스포에서 비전 AI 특화 제품 선보여
AI 영상 분석 전문기업인 씨이랩은 5월 1일~3일 서울 코엑스에서 열리는 ‘2024 국제인공지능대전(AI EXPO KOREA 2024)’을 통해 영상분야에 특화된 AI 제품을 선보였다고 전했다. 씨이랩은 이번 전시회에서 ▲AI 영상 분석 서비스 ‘비디고(VidiGo)’ ▲합성 데이터 생성 솔루션 ‘엑스젠(X-GEN)’ ▲쿠버네티스 기반 AI 플랫폼 ‘아스트라고(astrago)’ 등 자사의 비전 AI 기술이 적용된 주요 제품을 출품했다. 특히 씨이랩은 클라우드 기반 AI 영상분석 서비스 비디고의 신규 버전인 ‘비디고 서치엔진(VidiGo Search Engine)’을 공개했다. 비디고 서치엔진은 영상을 시청하지 않고도 검색을 통해 특정 객체나 장면을 AI가 빠르게 찾아낸다. 영상을 요약하거나 숏폼을 제작하는 ‘비디고 하이라이트(VidiGo Highlight)’의 후속 제품이다. 씨이랩의 최원준 리더는 “비디고 하이라이트는 누구나 쉽게 AI 영상 분석을 진행할 수 있도록 카카오톡 채널을 통해 출시한 반면, 비디고 서치엔진은 대규모의 영상을 보유한 기업을 타기팅하고 있다. 이번 행사에서 비디고의 주요 타깃인 미디어 산업 분야의 참관객들에게 높은 관심을 받았다”고 말했다.     한편, 씨이랩은 AI 엑스포의 부대행사로 ‘비전 AI의 현재와 미래’라는 주제의 세미나를 진행했다. 세미나에서 씨이랩의 채정환 부사장은 “현재의 AI 시장은 초거대 언어 모델(LLM) 중심으로 발전해왔고, 머지않아 초거대 비전 모델(LVM : Large Vision Model) 중심으로 확대될 것으로 전망한다”고 밝히며, 엔비디아 옴니버스 플랫폼과의 협력을 통한 LVM 구성 전략을 제시했다.
작성일 : 2024-05-03
RTX A400/A1000 : AI 기반 워크플로 강화하는 전문가용 GPU
개발 및 공급 : 엔비디아 주요 특징 : AI 처리를 위한 3세대 텐서 코어 및 레이 트레이싱을 위한 2세대 RT 코어 탑재, 암페어 아키텍처 기반의 CUDA 코어 탑재해 그래픽/컴퓨팅 처리속도 향상, 전문가 작업의 데이터를 처리속도 향상 위한 메모리 대역폭 증가, 효율적인 비디오 처리를 위한 인코딩/디코딩 엔진 탑재 등   엔비디아가 새로운 엔비디아 RTX A400과 RTX A1000 GPU를 통해 RTX 전문가용 그래픽 제품을 확장하고, 디자인을 비롯한 AI 기반 생산성 워크플로를 강화한다고 밝혔다. 디자인과 생산성 애플리케이션 전반에 걸친 AI 통합이 새로운 기준으로 자리잡으면서 고급 컴퓨팅 성능에 대한 수요가 증가하고 있다. 즉, 전문가와 크리에이터들은 프로젝트의 규모와 복잡성 또는 범위에 관계없이 향상된 컴퓨팅 성능을 활용해야 한다. 엔비디아 암페어(Ampere) 아키텍처 기반의 RTX A400과 RTX A1000 GPU는 이렇게 증가하는 수요를 충족하기 위해 개발됐으며, AI와 레이 트레이싱 기술에 대한 접근성을 확대해 전문가들이 일상적인 워크플로를 혁신하는데 필요한 도구를 제공한다.   ▲ 엔비디아 RTX A400   향상된 성능으로 창의성 및 효율 향상 지원 RTX A400 GPU는 RTX 400 시리즈 GPU에 가속화된 레이 트레이싱과 AI를 도입했다. 이 GPU는 AI 처리를 위한 24개의 텐서 코어(Tensor Cores)를 탑재해 기존 CPU 기반 솔루션을 넘는 성능을 제공한다. 이를 통해 전문가들은 지능형 챗봇, 코파일럿과 같은 최첨단 AI 애플리케이션을 데스크톱에서 직접 실행할 수 있다. 또한 GPU는 실시간 레이 트레이싱을 제공하므로 크리에이터는 생생하고 물리적 정확도가 높은 3D 렌더링을 제작할 수 있다. A400은 시리즈 최초로 4개의 디스플레이 출력을 지원해 금융 서비스, 명령과 제어, 유통, 운송과 같은 산업에 필수적인 고밀도 디스플레이 환경에 적합하다. 엔비디아 RTX A1000 GPU는 RTX 1000 시리즈 GPU에 처음으로 텐서 코어와 RT 코어를 도입했다. 이를 통해 전문가와 크리에이터를 위한 가속화된 AI와 레이 트레이싱 성능을 제공한다. A1000은 72개의 텐서 코어를 탑재해 이전 세대에 비해 업그레이드된 성능을 갖췄다. 스테이블 디퓨전(Stable Diffusion)과 같은 도구에서 3배 이상 빠른 생성형 AI 프로세싱을 제공하며, 18개의 RT 코어는 그래픽과 렌더링 작업 속도를 최대 3배까지 높여 2D와 3D CAD, 제품과 건축 설계, 4K 비디오 편집과 같은 전문적인 워크플로를 가속화한다. 더불어 A1000은 이전 세대보다 최대 38% 더 많은 인코딩 스트림을 처리하고 2배 더 빠른 디코딩 성능을 제공하는 등 비디오 처리 능력을 높였다.   ▲ 엔비디아 RTX A1000   차세대 기능을 통한 성능 강화 A400과 A1000 GPU는 싱글 슬롯 디자인에 전력소비량이 50W이며, 콤팩트하고 에너지 효율적인 워크스테이션을 위해 향상된 기능을 제공한다.  2세대 RT 코어 : 건축 도면, 3D 디자인, 콘텐츠 제작 등 모든 전문 워크플로를 위한 실시간 레이 트레이싱, 사실적인 물리 기반 렌더링과 시각화, 정확한 조명과 그림자 시뮬레이션으로 작업 품질을 높일 수 있다. 3세대 텐서 코어 : 생성형 AI, 이미지 렌더링 노이즈 제거, 딥러닝 슈퍼 샘플링과 같은 AI 증강 도구와 애플리케이션을 가속화해 이미지 생성 속도와 품질을 개선한다.  암페어 아키텍처 기반 쿠다 코어 : 암페어 아키텍처 기반의 쿠다(CUDA) 코어는 이전 세대 대비 최대 2배의 단정밀도 부동 소수점 처리량으로 그래픽과 컴퓨팅 워크로드의 속도를 크게 높인다. 4GB/8GB 메모리 : A400 GPU의 4GB와 A1000 GPU의 8GB GPU 메모리는 다양한 전문가용 요구 사항을 충족한다. 여기에는 기본적인 그래픽 디자인과 사진 편집부터 텍스처나 고해상도 편집, 데이터 분석이 필요한 까다로운 3D 모델링 등이 포함된다. 또한 이 GPU들은 이전 세대보다 메모리 대역폭이 증가해 데이터를 더 빠르게 처리하고 대용량 데이터 세트와 장면을 더 원활하게 처리할 수 있다. 인코딩/디코딩 엔진 : 7세대 인코드(NVENC)와 5세대 디코드(NVDEC) 엔진을 탑재한 새 GPU는 효율적인 비디오 처리를 기능을 제공한다. 이를 통해 초저지연으로 고해상도 비디오 편집, 스트리밍, 재생을 지원한다. 또한 AV1 디코드가 포함돼 더 많은 비디오 포맷을 더 효율적이고 원활하게 재생할 수 있다.   RTX 솔루션의 활용 범위 확대 엔비디아는 새로운 GPU가 최첨단 AI, 그래픽, 컴퓨팅 기능 등을 통해 사용자의 생산성을 높이고 창의적인 가능성을 열어준다고 전했다. 레이 트레이싱 렌더링과 AI가 포함된 고급 워크플로를 통해 전문가들은 작업의 한계를 뛰어넘고 놀라운 수준의 사실감을 구현할 수 있다. 기획 담당자들은 강력하고 에너지 효율적인 새로운 컴퓨팅 솔루션을 에지 배포에 사용할 수 있다. 크리에이터는 편집과 렌더링 속도를 높여 더욱 풍부한 시각적 콘텐츠를 제작할 수 있다. 건축가와 엔지니어는 아이디어를 3D CAD 개념에서 실제 디자인으로 원활하게 전환할 수 있다. 스마트 공간에서 작업하는 경우에는 공간 제약이 있는 환경에서 실시간 데이터 처리, AI 기반 보안, 디지털 사이니지 관리 등에 GPU를 사용할 수 있다. 또한 의료 전문가들은 더 빠르고 정밀한 의료 영상 분석을 수행할 수 있다.     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2024-05-02
[칼럼] 기업 성장 맵 - 엔비디아
트렌드에서 얻은 것 No.20   “It just works.(그냥 잘 됩니다.)”  - 젠슨 황(엔비디아 CEO)    생성형 AI의 일상화 - 비서를 두다 이제는 글 쓰는 데에 일상화된 질문과 답변이다. 그 전에는 없던 비서가 2년만에 생겼다. 그리고 그 비서의 역할로 인해 폭풍 성장하며 스스로 미래의 가치를 높인 기업이 바로 엔비디아이며, 그 중심에 젠슨 황이 있다. 최근 비즈니스 업그레이더 이재훈 Bzup 대표의 ‘챗GPT 10배 활용하기’ 강의를 들었다. 그리고 그의 노하우가 담긴 몇가지를 학습하고 적용해 보았다.  질문 : “너는 엔비디아 전문가야. 기술, 경영 전반에 걸쳐 두루두루 잘 분석하는 전문가야. 내가 질문하는 것에 대답 잘 해 줄꺼지? 엔비디아 기업 성장 맵을 만들려고 해. 엔비디아가 성장하는 과정에서 초창기, 성장기, 성숙기 등 하이프루프 방식으로 정리해줘.” 답변 : “엔비디아의 기업 성장 맵을 만드는 것은 흥미로운 과제군요! 먼저, 초창기 성장기, 성숙기 및 하이프루프 단계를 정의해야 할 것 같습니다. 각 단계에서 어떤 특징이 있고 어떤 전략이 필요한지에 대해 생각해 보겠습니다. 또한 이 단계들을 시각적으로 어떻게 나타낼지도 고려해야 할 것 같습니다. 어떻게 시작할까요?“ 질문 : “가트너가 해마다 전략을 정의하듯, 그리고 가트너가 기술을 정리하듯이 써줘.” 답변 : “가트너의 전략과 기술 정의를 따라 엔비디아의 성장 맵을 만들어 보는 건 탁월한 아이디어입니다! 각 단계를 적절히 정의하고, 초창기 성장기, 성숙기 및 하이프루프 단계에서의 특징과 필요한 전략을 명확히 설명해야 할 것입니다. 그리고 이를 가트너가 일반적으로 사용하는 방식으로 구성하여 보여주면 좋겠습니다. 어떻게 시작할까요?“  실제로 자세한 사실관계에 대한 내용은 위키백과에서 볼 수 있다. 엔비디아 기업 성장 맵을 써 보려고 한 것은 전세계가 열광한 엔비디아 GTC(GPU 기술 콘퍼런스) 이벤트 때문이다. 어떤 내용이길래, 어디서부터가 시작점이고 어떤 과정을 밟았는지에 대한 궁금증으로부터 출발한다.  “듣는 사람의 입장에서 생각해야 합니다.” - 젠슨 황(엔비디아 CEO)   엔비디아 GTC 2024  엔비디아 GTC 2024는 2024년 3월 18일부터 21일까지 미국 캘리포니아주 산호세에서 개최되었다. 이번 행사에서는 인공지능(AI) 분야의 최신 발전 사항과 엔비디아의 새로운 제품 및 기술들이 소개되었다. GTC 2024의 기조 연설에서 엔비디아 젠슨 황 CEO는 옴니버스(Omniverse), 드라이브(DRIVE), RTX, HGX 등 엔비디아의 4가지 주요 플랫폼과 기술 발전 방향을 제시했다. 특히, 옴니버스를 중심으로 한 메타버스 구축, 자율주행 자동차 개발, 고성능 컴퓨팅 분야에서의 혁신을 위한 자사의 노력을 강조했다. 첫 번째로, 엔비디아의 메타버스 플랫폼인 옴니버스는 실시간 3D 디자인 및 협업을 위한 새로운 기능들을 선보였다. 또한, 옴니버스 클라우드(Omniverse Cloud)를 통해 클라우드 기반 액세스와 확장성을 제공한다고 발표했다. 두 번째로, 엔비디아의 자율주행 자동차 플랫폼인 드라이브는 새로운 드라이브 오린(DRIVE Orin) SoC와 드라이브 하이페리온 8(DRIVE Hyperion 8) AI 센서를 공개했다. 또한, 여러 자동차 제조업체와의 협력을 통해 자율주행 자동차 개발을 가속화하고 있다고 밝혔다. 세 번째로, 엔비디아의 실시간 레이 트레이싱 기술인 RTX는 새로운 RTX 40 시리즈 GPU를 출시했다. 또한, DLSS 3.0 업데이트와 함께 게임, 영화 제작, 디자인 등 다양한 분야에서 더욱 향상된 그래픽 성능을 제공한다고 발표했다. 네 번째, 엔비디아의 고성능 컴퓨팅 플랫폼인 HGX는 새로운 HGX 폴라리스(HGX Polaris) 시스템을 공개했다. 또한, AI, 머신러닝, 과학적 컴퓨팅 등 첨단 컴퓨팅 분야에서 HGX 플랫폼의 활용도가 증가하고 있다고 밝혔다.  “대화의 주제를 정확하게 알아야 합니다.” - 젠슨 황(엔비디아 CEO)   생성형 AI의 도움으로 정리한 엔비디아 성장 스토리텔링 엔비디아의 초창기와 성장기에서 기술 혁신은 GPU로 시작되었다. 그래픽 처리 분야에서의 성능과 효율성을 크게 높였다. 경영 측면에서는 기술 혁신을 통해 게임 산업에 진입하고, 과학 및 엔터프라이즈 시장으로 확장하는 등의 전략을 펼쳤다. 트렌드 측면은 게임 산업의 성장과 함께 인공지능, 자율주행, 데이터센터 등 새로운 시장 트렌드에 대한 대비가 중요했다. 성숙기로 접어들면서 기술 측면은 기술 성숙과 더불어 딥러닝 및 가속화 기술을 강화하여 다양한 시장에서 적용 가능성을 높였다. 경영 측면에서는 성장한 시장에서 지속적인 경쟁력을 유지하기 위해 제품 다변화 및 글로벌 시장 진출을 강화하는 전략을 채택했다. 트렌드 측면에서는 인공지능 및 자율주행 분야에서의 성장을 주도하면서, 클라우드 컴퓨팅 및 데이터 중심 기술에 대한 수요가 증가했다. 하이프루프 관점으로 살펴보면, 기술 측면은 에지 컴퓨팅, 혼합현실 및 자율주행과 같은 미래 지향적인 기술에 집중하고 있다. 경영 측면은 기술 트렌드를 선도하며, 산업 파괴적 혁신을 통해 새로운 시장 기회를 발굴하는 전략을 수행하고 있다. 트렌드 측면은 인공지능과 빅데이터 분야의 지속적인 성장과 함께, 확장된 협력 모델 및 지속 가능한 기업 가치 창출이 중요한 트렌드이다. 흥미로운 분야의 성장으로 살펴보자. 기술 측면으로 볼 때 인공지능(AI) 및 머신러닝(ML) 분야에서의 GPU 가속화 기술을 향상시켜 왔으며, 이를 통해 다양한 산업에서의 AI 응용 프로그램을 지원하고 있다. 경영 측면은 AI 및 ML 분야에서의 리더십을 강화하기 위해 투자를 늘리고, 새로운 파트너십을 구축하여 생태계를 확장하고 있다. 트렌드 측면은 데이터 중심의 AI 및 ML 기술은 미래의 핵심 트렌드 중 하나로 자리 잡았으며, 엔비디아는 이를 주도하는 역할을 수행하고 있다. 전략을 구현하는 방안으로는 첫 번째, 글로벌 확장과 파트너십 강화이다. 기술 측면은 글로벌 시장에서의 성장을 위해 지역별 맞춤형 솔루션을 개발하고, 이를 통해 다양한 지역에서 시장 점유율을 확대하고 있다. 경영 측면은 다양한 산업과의 파트너십을 강화하여 협력 기회를 확장하고 있으며, 특히 클라우드 제공업체 및 자동차 제조업체와의 협업을 강화하고 있다. 트렌드 측면은 글로벌 경제 통합과 디지털화의 추세에 따라 경쟁력 강화, 지역적인 산업 생태계와의 협력을 통해 성장을 가속화하고 있다. 두 번째, 에지 컴퓨팅 및 혼합현실 분야 진출이다. 기술 측면은 에지 컴퓨팅 및 혼합현실 분야에서 새로운 기술을 개발하고, 이를 통해 스마트 시티, 스마트 공장 등 새로운 시장을 개척하고 있다. 경영 측면은 이러한 새로운 분야로의 진출을 위해 투자를 확대하고, 혁신적인 제품과 서비스를 개발하고 있다. 트렌드 측면은 에지 컴퓨팅 및 혼합현실이 미래의 주요 기술 트렌드로 떠오르고 있으며, 이를 선도하는 역할을 하고 있다.  엔비디아의 비전 실현을 위한 미래 전망으로 보면, 기술 측면은 지속적인 기술 혁신을 추구하고 인공지능, 자율주행, 에지 컴퓨팅 등의 분야에서 선도적인 역할을 수행하며, 경영 측면은 비전 실현을 위해 글로벌 시장에 대한 전략적 접근을 유지하고, 혁신적인 비즈니스 모델을 발전시켜 나갈 것이다. 트렌드 측면은 빠르게 변화하는 기술 및 시장 트렌드에 대응하면서, 지속적인 성장과 발전을 이루어 나갈 것이다. 엔비디아의 전망은 매우 밝다. 기술 혁신과 산업 변화의 중심에서 계속해서 성장하고 있는 엔비디아는 미래에도 주목할 가치가 있다. 첫째, 인공지능 및 자율주행 산업의 성장이다. 인공지능 및 자율주행 분야는 미래 산업의 중심이 될 것으로 예상된다. 엔비디아는 이러한 산업의 성장을 이끌어가는 주요 기업 중 하나로 남을 것이다. 둘째, 데이터 센터 및 에지 컴퓨팅 시장의 확대이다. 데이터 중심의 컴퓨팅이 더욱 중요해지면서 데이터 센터 및 에지 컴퓨팅 시장도 계속해서 성장할 것으로 예상되며, 엔비디아는 이러한 시장 확대에 선도적인 역할을 하며 새로운 성장 동력을 확보할 것이다. 셋째, 산업 파괴적 혁신과 새로운 시장 탐색이다. 엔비디아는 계속해서 기존 산업을 혁신하고 새로운 시장을 탐색하여 성장할 것으로 기대된다. 에지 컴퓨팅, 혼합현실 및 자율주행 분야의 혁신적인 제품과 서비스를 통해 더욱 다양한 시장에서 성공을 이룰 것이다. 마지막으로, 사회적 책임과 지속 가능한 경영이다. 엔비디아는 사회적 책임과 지속 가능한 경영을 더욱 강조할 것으로 예상된다. 환경 보호, 다양성 증진, 사회 공헌 등의 활동을 통해 미래 세대를 위한 지속 가능한 사회를 구축하는 데 기여할 것이다.  이러한 전망을 바탕으로 엔비디아는 미래에도 지속적인 성장과 발전을 이루어 나갈 것으로 기대된다.  “곧 망한다는 심정으로 일하라.” - 젠슨 황(엔비디아 CEO)   기업 성장 맵 - 엔비디아 2016년 샌프란시스코에서 열린 GTC에서 젠슨 황 CEO는 “저는 항상 우리 회사가 30일 안에 망할 것이라고 생각하며 일합니다. 이런 생각은 우리가 끊임없이 혁신하고 경쟁력을 유지하도록 동기를 부여합니다”라고 말했다. 2018년 CNBC와의 인터뷰에서도 그는 “우리는 항상 위기 의식을 가지고 일해야 합니다. 만약 우리가 현상에 만족하고 안주한다면, 곧 뒤처질 것입니다”라고 말하며, 경쟁력을 유지하기 위한 끊임없는 노력의 중요성을 강조했다. 최근인 2023년 11월에는 “기술 산업은 변화가 매우 빠릅니다. 우리가 앞서 나가고 싶다면 변화를 두려워하지 말고 적극적으로 새로운 도전을 해야 합니다. 만약 우리가 과거의 성공에 안주한다면, 곧 시장에서 사라질 것입니다”라고 말했다. 이처럼 젠슨 황 CEO는 여러 차례 “곧 망한다는 심정으로 일하라”는 메시지를 강조하며, 이는 엔비디아의 놀라운 성장과 혁신의 핵심 동력이 되었다는 평가를 받고 있다. 그래서 “곧 망한다는 심정으로 일하라”는 어록이 탄생했는지도 모르겠다. 엔비디아는 시스템 반도체 설계 등의 사업을 운영하는 미국의 기업이다. 80% 가량의 점유율을 기록하며 PC용 외장 GPU 리테일 시장에서 점유율 1위를 기록하고, 인공지능 칩 분야에서도 80% 이상의 점유율로 선두이다. 또한 자율주행 자동차 플랫폼 시장에서도 업계 선두를 유지하고 있다. 2020년대 이후로 AI 광풍이 불었고, 엔비디아는 GPU를 만들던 기술력으로 AI 칩을 생산하면서 전 세계에서 가장 주목받는 AI 수혜주로 등극했다. 이로 인해 2023년, 사상 처음으로 세계 반도체 기업 매출 1위에 등극했다 그들의 스토리는 1993년에 AMD의 마이크로프로세서 엔지니어였던 커티스 프리엠과 젠슨 황, 크리스 말라코스키의 세 명으로부터 시작되었다. 처음에는 CPU 생산을 기획했으나, 이 시장에 진입하는 것이 어렵다고 판단해서 비디오 게임으로 인해 수요가 높아진 그래픽 칩셋으로 눈길을 돌렸다.(출처 : 위키백과)  앞으로 어떤 행보를 보일지 또 어떤 가치로 반도체 시장을 주름잡을지 흥미롭게 지켜보면 좋겠다. 나는 그를 ‘대만에서 온 가죽 재킷을 입은 미래소년’이라고 부르고 싶다. 구글 제미나이(Gemini)에게 다음의 질문과  답변을 들어 보았다.  “앞으로의 전망과 엔비디아 GTC가 미래에는 뭘 하면 지구를 위해 더 가치 있는 일을 할 수 있을까? 스티브 잡스, 일론 머스크 스타일처럼 젠슨 황의 미래는 어떨 것 같아?” 제미나이는 다음과 같이 답변하였다.  “그는 ‘엔비디아의 기술은 전 세계 수 십억 명 사람들의 삶을 개선할 수 있는 잠재력을 가지고 있다’고 강조하며, 의료, 교육, 환경 분야에서도 엔비디아 기술을 활용하여 지속가능한 발전을 이루고자 하는 뜻을 밝히고 있습니다. 엔비디아가 미래에 지구를 위해 더 가치 있는 일을 할 수 있는 구체적인 방향은 다음과 같습니다.  AI 의료 플랫폼 구축 : 엔비디아의 강력한 GPU는 의료 영상 분석, 질병 진단, 맞춤형 치료 개발 등에 활용될 수 있습니다. 이를 통해 질병 치료의 정확성을 높이고, 치료 기간을 단축하며, 의료 비용을 절감하는 데 기여할 수 있습니다. 스마트 시티 구축 : 엔비디아 기술은 실시간 교통 시스템, 에너지 관리 시스템, 자율 주행 자동차 시스템 등을 구축하는 데 활용될 수 있습니다. 이를 통해 도시의 효율성을 높이고, 에너지 사용량을 줄이며, 시민들의 삶의 질을 향상시키는데 기여할 수 있습니다. 기후 변화 문제 해결 : 엔비디아 기술은 기후 모델링, 환경 모니터링, 재난 예측 시스템 개발 등에 활용될 수 있습니다. 이를 통해 기후 변화의 원인을 파악하고, 효과적인 대응 방안을 마련하며, 지구 환경 보호에 기여할 수 있습니다. 젠슨 황 CEO는 마치 스티브 잡스나 일론 머스크처럼 혁신적인 기술과 비전으로 세상을 변화시키는 리더로 평가받고 있습니다. 그는 기술을 통해 인간의 삶을 개선하고 지구를 더 나은 곳으로 만들고자 하는 강한 의지를 가지고 있으며, 이를 위해 끊임없이 노력하고 있습니다.”   (출처:gemini.google.com)   ▲ 기업 성장 맵 - 엔비디아편(Map by 류용효) (클릭하면 큰 그림으로 볼 수 있습니다.)   ■ 류용효 디원의 상무이며 페이스북 그룹 ‘컨셉맵연구소’의 리더로 활동하고 있다. 현업의 관점으로 컨설팅, 디자인 싱킹으로 기업 프로세스를 정리하는데 도움을 주며, 1장의 빅 사이즈로 콘셉트 맵을 만드는데 관심이 많다. (블로그)     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2024-05-02
HP, 개인 맞춤형 AI 경험에 집중한 AI PC 포트폴리오 공개
HP가 하이브리드 작업 환경에서 생산성과 창의성을 높이고 최적화된 사용자 경험을 제공하기 위한 AI PC 포트폴리오를 공개했다. HP는 상업용과 소비자용 PC 전반에 AI 기술을 접목해 기업과 개인 사용자에게 최적화된 PC 경험을 제공하며 AI PC 분야에서 리더십을 강화하겠다고 밝혔다. 글로벌 시장조사 업체 마켓앤마켓에 따르면 AI는 오는 2030년까지 연간 36.8%로 큰 폭의 성장을 이룰 것으로 전망되고 있으며 그에 따른 수요도 빠르게 증가하는 추세다. 특히 엔데믹 이후 하이브리드 근무가 뉴노멀로 자리잡으면서, 업무 환경에서 AI가 가져올 변화를 기대하는 목소리도 높다.  AI의 보급으로 소비자들이 생활 속에서 다양한 AI 기능을 활용하며, AI PC가 업계 내 주요 관심사로 떠올랐다. HP는 개인의 AI 경험에 방점을 둔 ‘나만의 AI PC’를 슬로건으로 내걸고, 엔드 포인트 사용자들의 다양한 요구에 맞춘 폭넓은 AI PC 포트폴리오를 선보였다. ‘나만의 AI PC’는 AI라는 혁신적인 기술이 가져올 변화도 중요하지만, 이를 사용하는 사용자에게 초점을 맞추고 개개인을 위한 맞춤 환경을 제공해 개인이 이뤄낼 수 있는 가능성과 잠재력을 끌어내겠다는 HP의 AI PC 로드맵을 담았다. HP는 기자간담회에서 AI 트렌드에 따라 변모한 PC 시장의 흐름을 공유하고 자사의 AI PC와 솔루션을 시연하는 한편 AI PC 혁신 전략을 공유했다. 전문가를 위한 워크스테이션, 하이브리드 근무에 최적화된 비즈니스 PC, 개인의 창의성을 높이는 소비자용 노트북, 향상된 플레이 경험을 제공하는 게이밍 노트북 제품에 AI 기술을 더해, 다양한 소비자들의 니즈에 맞춘 제품을 선보인다는 계획이다.     HP는 개개인에게 최적화된 소비자용 AI PC 제품으로 투인원 노트북인 ‘HP스펙터x360 14(HP Spectre x360 14)’와 HP의 14인치 게이밍 노트북 중 가장 가벼운 제품인 ‘HP 오멘 14 슬림(HP OMEN 14 Slim)’ 제품을 소개했다. 360도 회전 기능을 통해 노트북에서 태블릿으로 모드를 변경할 수 있는 스펙터 x360 14는 고성능 AI 칩을 활용해 자리를 뜨면 화면이 자동으로 꺼지는 ‘워크 어웨이 잠금(Walk away lock)’, 가까이 다가가면 기기가 빠르게 켜지는 ‘웨이크 온 접근(Wake on approach)’, 누군가 뒤에 있으면 물리적인 보안 위협을 미연에 방지하기 위해 화면이 흐려지는 ‘개인 정보 보호 경고’ 등 다양한 보안 기능을 사용자에게 제공한다. 또한 노트북의 배터리, 펜, 프로세서를 자동 모니터링하는 기능을 탑재해 생산성을 높이고 전력 낭비를 막는다.  비즈니스용 AI PC 부문에서는 사용자의 생산성을 높이고 협업을 원활하게 도와줄 수 있는 AI 기능을 탑재한 엘리트북 x360 1040 G11(Elitebook 1040 G11), Zbook 파워 G11(Zbook Power G11)을 소개했다. 엘리트북 x360 1040 G11은 인텔 코어 울트라 5, 7 프로세서, 2.8K OLED 디스플레이, 백라이트 및 저조도 조정, 자동 프레이밍 기능이 있는 5MP 카메라를 탑재한 AI PC이다. AI 기능이 내장되면서 이전 기기 대비 그래픽 성능이 80% 개선되었으며 전력 소모량은 38% 줄였다. 또한 AI 영상 편집 속도가 최대 132% 빨라졌으며 PC 전력 자동 변화 기능을 제공하는 HP 스마트 센스(HP Smart Sense)를 통해 소음을 40%까지 낮췄다. 모바일 워크스테이션인 Zbook 파워 G11은 AI 연산에 특화된 엔비디아 그래픽카드 RTX 3000 에이다 제네레이션(Ada Generation)을 탑재해 3D 모델링, AI 기반 콘텐츠 제작과 같이 까다로운 워크플로를 빠르고 효율적으로 처리한다. IT 전문가, 크리에이티브 및 엔터테이먼트 산업 종사자, 데이터 사이언티스트와 같이 복잡한 워크플로를 다루는 사용자들도 어디서나 작업할 수 있도록 설계됐으며, Z by HP 포트폴리오에 포괄적으로 적용되는 다양한 하드웨어 및 소프트웨어 보안 솔루션을 제공한다. 한편, HP는 AI PC를 선보이며 지속가능성을 달성하기 위한 노력을 지속하겠다는 의지를 재확인했다. 기후 행동, 인권, 디지털 형평성 분야에서 '가장 지속가능하고 공정한 정보기술(IT) 기업'이 되겠다는 비전을 세운 HP는 2030년 전 제품 및 포장재의 자원 순환성 75% 달성을 목표로 세운 바 있다. HP는 이를 위해 2022년 이후 출시한 모든 PC와 디스플레이에 재생 소재를 포함해 왔으며, 이번에 공개한 모든 제품에도 재생 소재를 사용했다. HP 코리아의 김대환 대표는 “HP는 미래를 준비하자는 의미인 ‘Future Ready’ 비전의 일환으로 AI 기술을 주목했다. AI는 수십 년 만에 가장 눈에 띄게 PC 시장의 역동성을 높이고 있으며 AI는 단순히 테크 산업뿐만 아니라 모든 비즈니스 전반에 영향을 끼치며 세계에 변화를 불러일으킬 바람”이라며, “계속해 변화하는 소비자의 라이프 스타일과 시장의 게임체인저 역할을 할 AI 기술을 모든 분야의 기기에 녹여 그 어느 때보다 개인화된 PC를 제공할 예정”이라고 전했다.
작성일 : 2024-04-30
CAD&Graphics 2024년 5월호 목차
  INFOWORLD   Focus 17 디지털 제조 & 뿌리산업 컨퍼런스, 디지털 기술 기반의 제조산업 혁신 및 성장 전략 소개 22 빌드스마트포럼 2024, Al와 메타버스의 시너지로 변화하는 AEC 탐구 24 마이다스아이티, 제조산업을 위한 CAE 기술과 솔루션 로드맵 제시 26 로크웰 오토메이션, AI·클라우드 접목한 디지털 제조 기술 소개 28 한국산업지능화협회, ‘2024 스마트공장엑스포와 산업지능화 콘퍼런스’ 개최 51 오라클, 모던 데이터 플랫폼 및 데이터베이스 혁신 전략 발표 54 델 테크놀로지스, AI 시대 겨냥한 기업용 PC 제품군 소개 56 레노버, “더 많은 CPU 코어로 워크스테이션 성능 높인다”   People&Company 30 한국알테어 이승훈 기술 총괄 본부장 더욱 빠르고 효율적인 제품 개발을 위한 AI 기술 본격화 추진 33 데이터킷 필리프 블라슈 CEO CAD 데이터 변환과 상호운영성 기술로 한국 시장 공략 강화   Case Study 36 책임감 있는 AI 활용 및 향상된 모델 훈련 유니티 뮤즈의 텍스처/스프라이트 생성 및 파운데이션 모델 New Products 40 리브랜딩과 함께 건축 설계의 생산성 강화 캐드마스터 2025 44 AI로 생산성 높이는 기업용 PC 프로세서 라이젠 프로 8040/8000 시리즈 46 AI 기반 워크플로 강화하는 전문가용 GPU RTX A400/A1000 48 콘텐츠 생성의 퍼포먼스와 효율 강화 언리얼 엔진 5.4 프리뷰 58 이달의 신제품   Column 62 디지털 지식전문가 조형식의 지식마당 / 조형식 디지털 엔지니어링의 프레임워크와 네 가지 스피어 64 책에서 얻은 것 No. 19 / 류용효 기업 성장 맵 – 엔비디아 편   On Air 73 캐드앤그래픽스 CNG TV 지식방송 지상중계 배터리 산업 동향과 배터리 최적화를 위한 설계/시뮬레이션 기술 60 New Books 68 News   Directory 123 국내 주요 CAD/CAM/CAE/PDM 소프트웨어 공급업체 디렉토리   CADPIA   AEC 74 BIM 칼럼니스트 강태욱의 이슈 & 토크 / 강태욱 오픈AI CLIP 모델의 이해/코드 분석/개발/사용 82 복잡한 모델에서 인사이트를 얻고 설계 의사결정을 돕는 직스캐드 (2) / 이소연 포인트 클라우드 기능 85 새로워진 캐디안 2024 살펴보기 (5) / 최영석 캐디안 2024의 스크립트 기능 88 데스크톱/모바일/클라우드를 지원하는 아레스 캐드 2025 (1) / 천벼리 아레스 캐드 2025의 새로운 기능   Reverse Engineering 94 문화유산 분야의 이미지 데이터베이스와 활용 사례 (5) / 유우식 고지도 데이터베이스   Analysis 103 시뮤텐스 소프트웨어를 활용한 복합소재 해석 (2) / 씨투이에스코리아 시뮤필의 복합재 수지 해석 기능 소개 106 앤시스 워크벤치를 활용한 해석 성공사례 / 노은솔 PyMAPDL의 기초부터 활용까지 110 산업 디지털 전환을 위한 버추얼 트윈 (1) / 안치우 1D 시뮬레이션을 위한 카티아 다이몰라 120 성공적인 유동 해석을 위한 케이던스의 CFD 기술 (9) / 나인플러스IT 미래 자동차 설계를 위한 DNS, LES, RANS 시뮬레이션   Mechanical 114 제품 개발 혁신을 가속화하는 크레오 파라메트릭 10.0 (12) / 김주현 사용자 정의 피처의 생성 및 활용   캐드앤그래픽스 2024년 5월호 목차 from 캐드앤그래픽스  
작성일 : 2024-04-30
스노우플레이크, 엔터프라이즈급 LLM ‘아크틱’ 출시
데이터 클라우드 기업 스노우플레이크가 높은 개방성과 성능을 내세운 엔터프라이즈급 대규모 언어 모델(LLM)인 ‘스노우플레이크 아크틱(Snowflake Arctic)’을 출시했다. 스노우플레이크의 전문가혼합(MoE) 방식으로 설계된 아크틱은 기업의 복잡한 요구사항 처리에도 최적화되어 SQL 코드 생성, 명령 이행 등 다양한 기준에서 최고 조건을 충족한다. 특히 아크틱은 무료로 상업적 이용까지 가능한 아파치 2.0 라이선스로, 스노우플레이크는 AI 학습 방법에 대한 연구의 자세한 사항을 공개하며 엔터프라이즈급 AI 기술에 대한 개방 표준을 제안했다. 또한 아크틱 LLM은 스노우플레이크 아크틱 모델군(Snowflake Arctic model family)의 일부로, 검색 사용을 위한 텍스트 임베딩 모델도 포함됐다. 오픈소스 모델인 아크틱은 코드 템플릿과 함께 추론과 학습방식을 선택할 수 있는 유연성도 제공한다. 사용자는 엔비디아 NIM, 텐서RT-LLM(TensorRT-LLM), vLLM, 허깅페이스(Hugging Face) 등 기업이 선호하는 프레임워크로 아크틱을 사용하고 커스터마이징할 수 있다. 스노우플레이크 코텍스(Snowflake Cortex)에서는 서버리스 추론을 통해 아크틱을 즉시 사용할 수도 있다. 스노우플레이크 코텍스는 완전 관리형 서비스로, 허깅페이스, 라미니(Lamini), 마이크로소프트 애저, 엔비디아 API 카탈로그, 퍼플렉시티(Perplexity), 투게더 AI(Together AI) 등 다양한 모델 목록과 함께 데이터 클라우드에서 머신러닝 및 AI 솔루션을 제공한다. 아마존웹서비스(AWS)에서도 아크틱 사용이 가능해질 예정이다.     스노우플레이크는 기업이 각자의 데이터를 활용해 실용적인 AI/머신러닝 앱 제작에 필요한 데이터 기반과 최첨단 AI 빌딩 블록을 제공한다. 고객이 스노우플레이크 코텍스를 통해 아크틱을 사용할 경우 데이터 클라우드의 보안 및 거버넌스 범위 내에서 프로덕션급 AI 앱을 적정 규모로 구축하는 것이 더욱 쉬워진다.  아크틱 LLM이 포함된 스노우플레이크 아크틱 모델군에는 스노우플레이크가 최근 출시한 최첨단 텍스트 임베딩 모델 중 하나인 아크틱 임베드(Arctic embed)도 포함된다. 이 제품은 아파치 2.0 라이선스로 오픈소스 커뮤니티에서 무료로 사용할 수 있다. 5가지 모델로 구성된 이 제품군은 허깅페이스에서 바로 사용할 수 있으며, 스노우플레이크 코텍스에 내장돼 프라이빗 프리뷰 형태로 공개될 예정이다. 유사 모델의 약 3분의 1 크기인 이 임베딩 모델은 높은 검색 성능을 발휘하도록 최적화되어, 기업들이 검색증강생성(RAG) 또는 시맨틱 검색 서비스의 일부로 고유의 데이터 세트를 LLM과 결합할 때 효과적이고 경제적인 솔루션을 제공한다. 스노우플레이크의 슈리다 라마스워미(Sridhar Ramaswamy) CEO는 “스노우플레이크 AI 연구팀은 AI 분야 최전방에서 혁신을 이끌며 자사에 중요한 전환점을 마련했다”면서, “스노우플레이크는 오픈소스로 업계 최고 성능과 효율을 AI 커뮤니티에 공개하면서 오픈소스 AI가 지닌 가능성의 영역을 넓혀가고 있다. 고객에게 유능하면서도 믿을 수 있는 AI 모델을 제공할 수 있는 스노우플레이크의 AI 역량도 높아지고 있다”고 말했다.
작성일 : 2024-04-25
엔비디아, AI 기반 워크플로 강화하는 RTX A400과 A1000 GPU 출시
엔비디아가 새로운 엔비디아 RTX A400과 RTX A1000 GPU를 통해 RTX 전문가용 그래픽 제품을 확장하고, 디자인을 비롯한 AI 기반 생산성 워크플로를 강화한다고 밝혔다. 디자인과 생산성 애플리케이션 전반에 걸친 AI 통합이 새로운 기준으로 자리잡으면서 고급 컴퓨팅 성능에 대한 수요가 증가하고 있다. 즉, 전문가와 크리에이터들은 프로젝트의 규모와 복잡성 또는 범위에 관계없이 향상된 컴퓨팅 성능을 활용해야 한다. 엔비디아 암페어(Ampere) 아키텍처 기반의 RTX A400과 RTX A1000 GPU는 이렇게 증가하는 수요를 충족하기 위해 개발됐으며, AI와 레이 트레이싱 기술에 대한 접근성을 확대해 전문가들이 일상적인 워크플로를 혁신하는데 필요한 도구를 제공한다.   ▲ 엔비디아 RTX A400   RTX A400 GPU는 RTX 400 시리즈 GPU에 가속화된 레이 트레이싱과 AI를 도입했다. 이 GPU는 AI 처리를 위한 24개의 텐서 코어(Tensor Cores)를 탑재해 기존 CPU 기반 솔루션을 넘는 성능을 제공한다. 이를 통해 전문가들은 지능형 챗봇, 코파일럿과 같은 최첨단 AI 애플리케이션을 데스크톱에서 직접 실행할 수 있다. 또한 GPU는 실시간 레이 트레이싱을 제공하므로 크리에이터는 생생하고 물리적 정확도가 높은 3D 렌더링을 제작할 수 있다. A400은 시리즈 최초로 4개의 디스플레이 출력을 지원해 금융 서비스, 명령과 제어, 유통, 운송과 같은 산업에 필수적인 고밀도 디스플레이 환경에 적합하다.   ▲ 엔비디아 RTX A1000   엔비디아 RTX A1000 GPU는 RTX 1000 시리즈 GPU에 처음으로 텐서 코어와 RT 코어를 도입했다. 이를 통해 전문가와 크리에이터를 위한 가속화된 AI와 레이 트레이싱 성능을 제공한다. A1000은 72개의 텐서 코어를 탑재해 이전 세대에 비해 업그레이드된 성능을 갖췄다. 스테이블 디퓨전(Stable Diffusion)과 같은 도구에서 3배 이상 빠른 생성형 AI 프로세싱을 제공하며, 18개의 RT 코어는 그래픽과 렌더링 작업 속도를 최대 3배까지 높여 2D와 3D CAD, 제품과 건축 설계, 4K 비디오 편집과 같은 전문적인 워크플로를 가속화한다. 더불어 A1000은 이전 세대보다 최대 38% 더 많은 인코딩 스트림을 처리하고 2배 더 빠른 디코딩 성능을 제공하는 등 비디오 처리 능력을 높였다. 엔비디아 RTX A400과 A1000 GPU에 탑재된 2세대 RT 코어는 건축 도면, 3D 디자인, 콘텐츠 제작 등 모든 전문 워크플로를 위한 실시간 레이 트레이싱, 사실적인 물리 기반 렌더링과 시각화, 정확한 조명과 그림자 시뮬레이션으로 작업 품질을 높일 수 있다. 3세대 텐서 코어는 생성형 AI, 이미지 렌더링 노이즈 제거, 딥러닝 슈퍼 샘플링과 같은 AI 증강 도구와 애플리케이션을 가속화해 이미지 생성 속도와 품질을 개선한다. 암페어 아키텍처 기반의 쿠다(CUDA) 코어는 이전 세대 대비 최대 2배의 단정밀도 부동 소수점 처리량으로 그래픽과 컴퓨팅 워크로드의 속도를 크게 높인다. A400 GPU의 4GB와 A1000 GPU의 8GB GPU 메모리는 다양한 전문가용 요구 사항을 충족한다. 여기에는 기본적인 그래픽 디자인과 사진 편집부터 텍스처나 고해상도 편집, 데이터 분석이 필요한 까다로운 3D 모델링 등이 포함된다. 또한 이 GPU들은 이전 세대보다 메모리 대역폭이 증가해 데이터를 더 빠르게 처리하고 대용량 데이터 세트와 장면을 더 원활하게 처리할 수 있다. 7세대 인코드(NVENC)와 5세대 디코드(NVDEC) 엔진을 탑재한 새 GPU는 효율적인 비디오 처리를 기능을 제공한다. 이를 통해 초저지연으로 고해상도 비디오 편집, 스트리밍, 재생을 지원한다. 또한 AV1 디코드가 포함돼 더 많은 비디오 포맷을 더 효율적이고 원활하게 재생할 수 있다. A400과 A1000 GPU는 싱글 슬롯 디자인에 전력소비량이 50W에 불과하며, 콤팩트하고 에너지 효율적인 워크스테이션에 인상적인 기능을 제공한다.  엔비디아는 새로운 GPU가 최첨단 AI, 그래픽, 컴퓨팅 기능 등을 통해 사용자의 생산성을 높이고 창의적인 가능성을 열어준다고 전했다. 레이 트레이싱 렌더링과 AI가 포함된 고급 워크플로를 통해 전문가들은 작업의 한계를 뛰어넘고 놀라운 수준의 사실감을 구현할 수 있다. 기획 담당자들은 강력하고 에너지 효율적인 새로운 컴퓨팅 솔루션을 에지 배포에 사용할 수 있다. 크리에이터는 편집과 렌더링 속도를 높여 더욱 풍부한 시각적 콘텐츠를 제작할 수 있다. 건축가와 엔지니어는 아이디어를 3D CAD 개념에서 실제 디자인으로 원활하게 전환할 수 있다. 스마트 공간에서 작업하는 경우에는 공간 제약이 있는 환경에서 실시간 데이터 처리, AI 기반 보안, 디지털 사이니지 관리 등에 GPU를 사용할 수 있다. 또한 의료 전문가들은 더 빠르고 정밀한 의료 영상 분석을 수행할 수 있다.
작성일 : 2024-04-18
엔비디아, AI 개발 가속화 위해 구글 클라우드와 협력
엔비디아가 구글 클라우드와 협력을 통해 전 세계 스타트업의 생성형 AI 애플리케이션과 서비스 개발 가속화를 지원한다고 발표했다. 양사의 이번 협력은 다양한 규모의 기업이 생성형 AI 애플리케이션을 개발하는데 드는 비용을 절감하고 장벽을 완화하기 위해 공개된 일련의 발표들 중 가장 최근에 이뤄진 것이다.  특히 스타트업은 AI 투자에 대한 높은 비용으로 인해 많은 제약을 받고 있다. 이번 협업으로 엔비디아와 구글 클라우드는 클라우드 크레딧, 시장 진출 지원, 그리고 기술 전문 지식에 대한 접촉 기회 확대를 통해 고객에게 더 빠르게 스타트업의 가치를 제공하도록 지원한다. 1만 8000개 이상의 스타트업을 지원하는 엔비디아 인셉션 글로벌 프로그램의 회원은 특히 AI에 중점을 둔 스타트업의 경우 최대 35만 달러의 구글 클라우드 크레딧을 제공받고 구글 클라우드 인프라 사용 가속화 경로를 확보할 수 있다. 구글 포 스타트업 클라우드 프로그램 멤버는 엔비디아 인셉션에 가입해 기술 전문 지식, 엔비디아 딥 러닝 인스티튜트(Deep Learning Institute) 과정 크레딧, 엔비디아 하드웨어와 소프트웨어 등을 이용할 수 있다. 또한 구글 포 스타트업 클라우드 프로그램의 스타트업 회원은 해당 분야에 관심이 있는 벤처 투자 기관에 노출될 기회를 주는 엔비디아 인셉션 캐피탈 커넥트(Inception Capital Connect) 플랫폼에 참여할 수 있다. 두 프로그램 모두에서 급성장한 신생 소프트웨어 제조업체는 구글 클라우드 마켓플레이스(Marketplace) 등록해 공동 마케팅, 제품 개발 가속화 지원을 우선적으로 받을 수 있다.     구글 딥마인드(DeepMind)는 지난 2월 최첨단 개방형 모델 제품군 젬마(Gemma)를 공개했는데,  엔비디아는 최근 구글과 협력해 모든 젬마 전용 엔비디아 AI 플랫폼에 대한 최적화를 실시했다. 젬마는 구글 딥마인드의 가장 뛰어난 모델인 제미나이(Gemini) 제작에 사용된 동일한 연구와 기술로 구축됐다. 양사의 긴밀한 협력으로 거대 언어 모델(LLM) 추론 최적화를 위한 오픈 소스 라이브러리 엔비디아 텐서RT-LLM(TensorRT-LLM)을 통해 엔비디아 GPU로 젬마를 실행, 젬마의 성능을 발전시켰다. 젬마 7B(Gemma 7B), 리커런트젬마(RecurrentGemma), 코드젬마(CodeGemma)를 포함한 젬마 모델 제품군은 엔비디아 API 카탈로그에서 사용 가능하며, 사용자는 이를 브라우저에서 사용하거나, API 엔드포인트로 프로토타입을 제작하거나, NIM을 통한 셀프 호스팅을 할 수 있다. 구글 클라우드를 사용하면 GKE와 구글 클라우드 HPC 툴킷으로 플랫폼 전반에 엔비디아 네모(NeMo) 프레임워크를 배포하기 쉬워진다. 이를 통해 개발자는 생성형 AI 모델의 훈련과 제공을 확장하고 자동화할 수 있으며, 개발 과정에 빠르게 착수하는 맞춤형 청사진을 통해 턴키 환경을 신속히 구축할 수 있다. 엔비디아 AI 엔터프라이즈의 일부인 엔비디아 네모는 구글 클라우드 마켓플레이스에서도 이용 가능하다. 이를 통해 고객들은 네모 및 기타 프레임워크에 쉽게 액세스해 AI 개발을 가속할 수 있다. 구글 클라우드는 엔비디아 생성형 AI 가속 컴퓨팅의 가용성 확대를 위해 5월 A3 메가(Mega)의 정식 출시를 발표했다. 이 인스턴스는 엔비디아 H100 텐서 코어(H100 Tensor Core) GPU로 구동되는 A3 가상 머신(VM) 제품군의 확장으로, A3 VM에서 GPU 대 GPU 네트워크 대역폭이 두 배로 늘었다. A3에 탑재된 구글 클라우드의 새로운 컨피덴셜(Confidential) VM에는 컨피덴셜 컴퓨팅에 대한 지원도 포함돼 있어, 고객이 H100 GPU 가속에 액세스하는 동안 코드를 변경하지 않고도 민감 데이터의 기밀성과 무결성을 보호하고 학습과 추론 도중 애플리케이션과 AI 워크로드를 보호할 수 있다. 이 GPU 기반 컨피덴셜 VM은 올해 미리보기로 제공될 예정이다. 한편, 블랙웰(Blackwell) 플랫폼에 기반한 엔비디아의 최신 GPU는 2025년 초에 엔비디아 HGX B200과 엔비디아 GB200 NVL72 등 두 가지 버전으로 구글 클라우드에 출시될 예정이다. HGX B200은 가장 까다로운 AI, 데이터 분석 그리고 고성능 컴퓨팅 워크로드를 위해 설계됐으며, GB200 NVL72는 차세대, 대규모, 조 단위의 매개변수 모델 학습과 실시간 추론을 위해 설계됐다. 엔비디아 GB200 NVL72는 각각 2개의 엔비디아 블랙웰 GPU와 엔비디아 그레이스 CPU(Grace CPU)가 결합된 36개의 그레이스 블랙웰 슈퍼칩을 900GB/s의 칩투칩(chip-to-chip) 인터커넥트를 통해 연결한다. 이는 하나의 엔비디아 NV링크(NVLink) 도메인에서 최대 72개의 블랙웰 GPU와 130TB/s의 대역폭을 지원한다. 통신 병목 현상을 극복하고 단일 GPU처럼 작동해 이전 세대 대비 30배 빠른 실시간 LLM 추론과 4배 빠른 트레이닝을 제공한다. 엔비디아는 지난 3월 생성형 AI의 요구사항에 최적화된 엔터프라이즈 개발자용 AI 플랫폼인 엔비디아 DGX 클라우드를 H100 GPU 기반의 A3 VM에서 사용할 수 있다고 발표했다. GB200 NVL72가 탑재된 DGX 클라우드는 2025년 구글 클라우드에서도 제공될 예정이다.
작성일 : 2024-04-12
인텔, 기업용 AI를 위한 ‘가우디 3’ 및 AI 개방형 시스템 전략 발표
인텔은 연례 고객 및 파트너 콘퍼런스인 ‘인텔 비전 2024’에서 기업용 생성형 AI를 위한 성능, 개방성 및 선택권을 제공할 인텔 가우디 3(Intel Gaudi 3) 가속기를 공개했다. 그리고 이와 함께 생성형 AI 도입 가속화를 위한 새로운 개방형 스케일러블 시스템 스위트, 차세대 제품 및 전략적 협력도 발표했다.  인텔 가우디 3 AI 가속기는 공통 표준을 따르는 이더넷을 통해 최대 수만 개의 가속기를 연결해 AI 시스템을 구동한다. 인텔 가우디 3는 BF16에 대해 4배 더 많은 AI 컴퓨팅 및 기존 모델 대비 1.5배 커진 메모리 대역폭을 지원한다. 인텔은 “이 가속기는 생성형 AI를 대규모로 배포하려는 글로벌 기업에게 AI 학습 및 추론 분야에서 획기적인 도약을 지원할 수 있다”고 설명했다.   ▲ 인텔 팻 겔싱어 CEO   인텔은 가우디 3가 70억 개 및 130억 개의 매개변수가 있는 라마2(Llama2) 모델과 GPT-3 1750억개 매개변수 모델 전체에서 엔비디아 H100보다 평균 50% 더 빠른 학습 시간을 제공할 것으로 예상하고 있다. 또한 인텔 가우디 3 가속기 추론 처리량은 평균적으로 H100보다 50%, 전력 효율성의 경우 라마(Llama) 70억 개 및 700억 개 매개변수와 팔콘(Falcon) 1800억 개 매개변수 모델에서 평균 40% 더 우수할 것으로 예상한다. 인텔 가우디 3는 개방형 커뮤니티 기반 소프트웨어와 업계 표준 이더넷 네트워킹을 제공한다. 또한 기업은 싱글 노드에서 클러스터, 슈퍼 클러스터, 수천 개의 노드가 있는 메가 클러스터로 유연하게 확장할 수 있으며, 최대 규모의 추론, 미세 조정 및 학습을 지원한다. 인텔 가우디 3는 2024년 2분기에 델 테크놀로지스, HPE, 레노버, 슈퍼마이크로를 비롯한 OEM 시스템에 탑재될 예정이다. 또한 인텔은 하드웨어, 소프트웨어, 프레임워크, 툴 등을 포함한 개방형 스케일러블 AI 시스템에 대한 전략을 제시했다. 인텔의 이러한 접근법은 기업별 생성형 AI 요구 사항을 충족하는 솔루션을 제공하기 위한 것으로, 다양하고 개방적인 AI 생태계를 가능케 한다. 여기에는 장비 제조업체, 데이터베이스 공급자, 시스템 통합업체, 소프트웨어 및 서비스 공급자 등이 포함된다. 또한, 기업 고객이 이미 알고 신뢰하는 생태계 파트너 및 솔루션을 활용할 수 있는 부분도 장점으로 꼽힌다. 인텔은 다양한 업계의 기업 고객 및 파트너들과 새롭고 혁신적인 생성형 AI 응용 프로그램을 개발하기 위해 인텔 가우디를 활용해 협력하고 있다고 밝혔다. 예를 들어, 네이버는 클라우드에서부터 온디바이스까지 첨단 AI 서비스를 전세계에 배포하기 위해 강력한 LLM 모델을 개발하고 있는데, 대규모 트랜스포머 아키텍처 기반 모델의 컴퓨팅 작업을 뛰어난 와트 당 퍼포먼스로 실행하기 위해 인텔 가우디를 사용한다. 보쉬는 자사 기반 모델 개발을 포함한 스마트 제조의 가능성을 모색하고 있으며, 합성 데이터 세트 생성과 더불어 자동 광학 검사와 같은 견고하고 분산된 트레이닝 세트 제공한다. 이에 더해 구글 클라우드, 탈레스, 코히시티(Cohesity)가 클라우드 환경에서 기밀 컴퓨팅 역량을 활용할 수 있도록 인텔과의 협력을 발표했다.    인텔은 인텔 가우디 3 가속기 외에도 엔터프라이즈 AI의 모든 부문에 걸쳐 차세대 제품 및 서비스에 대한 업데이트를 발표했다. 새로운 인텔 제온 6 프로세서는 폐쇄적 데이터를 사용하여 비즈니스에 특화된 결과를 생성하는 RAG를 포함한 최신 생성형 AI 솔루션을 실행할 수 있다. 2024년 출시될 차세대 인텔 코어 울트라 클라이언트 프로세서 제품군(코드명 루나레이크)은 차세대 AI PC를 위해 플랫폼 기준 100 TOPS 이상, NPU에서 45TOPS 이상을 제공할 예정이다. 인텔은 울트라 이더넷 컨소시엄(UEC)을 통해 AI 패브릭을 위한 개방형 이더넷 네트워킹을 선도하며 다양한 AI 최적화 이더넷 솔루션을 선보이고 있다.  인텔의 팻 겔싱어(Pat Gelsinger) CEO는 “혁신은 전례 없는 속도로 발전하고 있으며, 반도체가 이 모든 것을 가능하게 한다. 또한 모든 기업이 빠르게 AI 기업으로 거듭나고 있다”면서, “인텔은 PC부터 데이터센터, 에지에 이르기까지 기업 전반의 모든 곳에 AI를 가능하게 하고 있다. 인텔의 최신 가우디, 제온 및 코어 Ultra 플랫폼은 변화하는 고객과 파트너의 요구를 충족하고 앞으로의 엄청난 기회를 활용할 수 있도록  유연한 솔루션 세트를 제공하고 있다”고 밝혔다.
작성일 : 2024-04-11